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Muzicologie asistată de calculator 


Un algoritm original pentru aproximarea 
gradului de similitudine a două profiluri 
melodice arbitrare! 


Claudius lacob 


În speculatia muzicologică, analiza formală a fost cea 
care a catalizat dintotdeauna, și într-o substanţială măsură, 
energiile creatoare puse în joc. Subiectul este cu totul vast. 
Chiar și cea mai fugitivă trecere în revistă a sa ar consuma lejer 
jumătate din spaţiul rezervat acestui articol — și ar umple 
paginile cu un text deopotrivă dens si superficial despre teze, 
concepte, marote, modele structurale, sisteme de exegeză, 
ș.a., — și asta dacă ar fi doar să amintesc de Burmeister, 
Mattheson, d'Indy, Schering, Riemann, Adler, Kurth, Hindemith, 


1 Textul de fata reproduce, cu minimele modificări și adăugiri pe care 
le-a impus recontextualizarea sa, un fragment restrans al tezei mele 
de doctorat cu titlul Stare de grație. Gratia unei stări. O teorie 
integratoare pentru analiza, explicarea si reproducerea algoritmica a 
proceselor componistice, aplicată în soft-ul muzical MAIDENS. La 
data trimiterii spre publicare a prezentului articol, teza a trecut prin 
procedura de pre-sustinere, însă nu a fost încă prezentată public. 
Odată ce acest lucru se va întâmpla, textul integral va deveni 
disponibil pe site-ul Universităţii Naţionale de Muzică din București, la 
adresa https://www.unmb.ro. 
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sau — mai aproape de noi, Tudor Ciortea, Sigismund Toduta, 
Wilhelm Berger, Ștefan Niculescu ori Gheorghe Firca. 


În cele ce urmează însă, eu voi aborda subiectul — nu 
dezbărându-mă de tradiţie, ci în fapt împlinind-o (căci analiza 
formală a început a cocheta încă din zorii secolului trecut cu 
domenii precum lingvistică, dialectică, estetică, psihologie, 
logică, ș.a.) — din perspectivă informatică. 


Abordarea este, în fapt, mixtă. Pornind de la un grup de 
asertiuni ce vizează procesele cognitive implicate în percepţia 
muzicală, și de la postulatul că orice formă muzicală 
reprezintă, în fapt, o arborescenta de nou, repetiție, si variere 
am elaborat un algoritm care să permită unui soft informatic 
evaluarea autonomă -— altfel spus, fără ajutor uman - a 
gradului de similaritate dintre două structuri sonore monodice și 
diacrone. Este doar primul pas (însă probabil cel mai important) 
în construirea automata a unei arborescente precum cea 
menţionată mai sus: întrucât — evident — pentru a decide în ce 
fel noutatea si redundanta se cristalizează într-o forma 
muzicală, trebuie mai întâi să fii capabil să auditezi, într-o 
manieră fiabilă și consecventă, gradul de redundanta a două 
structuri date. Odată această abilitate deţinută, restul vine de la 
sine — prin iterații si recontextualizări (lărgiri progresive ale 
domeniului de analiză) — până ce, într-un final, întreaga piesă 
muzicală este acoperită. 


Merită menţionat că, deși algoritmul propriu-zis descris 
mai jos a fost elaborat pentru a funcţiona în cadrul primeia 
dintre sintaxele muzicale descrise de Stefan Niculescu’ — 
pentru a opera, deci, cu material melodic — principiile după care 
este construit el pot fi cu succes adaptate pentru lucrul cu alte 
sintaxe, de pildă omofonie sau polifonie. 


1 Ștefan Niculescu, „O teorie a sintaxei muzicale”, în Muzica nr. 
3/1973. 
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Parametru: fragment melodic sursă Parametru: fragment melodic țintă 


Parametru: 
Fereastră de analiză 


Flux intonational sursă (original) 


Flux intonational țintă (original) 


“Mb 
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Flux ritmic sursă (original) 


——+ ir 
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k 
E/ 
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Flux gravitonic sursă (original) Flux gravitonic țintă (original) 


| 
B 
E 


aceeași lungime, (același numar 
de alemento) prin mediere și 
interpolare. 


= 
O00 


Flux intonational sursă(derivat) Flux intonational țintă (derivat) 
‘esi ile 


Produce valoarea de referință 
„eta manim” (maximum de 
‘iteranta posibi la nivelul fiecărui 
nu). 


A 


forvastra do 
an 


Flux ritmic sursă (derivat) Flux ritmic țintă (derivat) 


= 


z 


= 


Max. DELTA gravitonic 


Flux gravitonic sursă (derivat) 


+ lin k 


Flux gravitonic țintă (derivat) 


o om 


Produce descriptori numerici ai 
evolujei individuale !a nive! de Mux 


Fig. 1a. Diagrama mixtă (schemă bloc și flux de lucru) a 
algoritmului de aproximare a similitudinii dintre două fragmente 
melodice arbitrare (continuă pe pagina următoare). 
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yi dit 
Preprocesor 


Produce descriptori numerici ai 
evoluției individuale la nivel de flux 


0 


=e og 


Evolutie înălțimi Evolutie ritm Evolutie sunete pivot (gravitonie) 
i sursă 
1 64751 53742 1 23100 23100 —_ 
2 70102 130422 2 35754 23948 
à| vel E [d 


Realizează operaţia XOR (excluziune k 


) la nivelul fiecărei perechi şi 
la nivelul fiecărui flux. 


< 


Evoluție înălțimi Evoluție ritm Evoluție sunete pivot (gravitonie) 
DELTA DELTA DELTA 


11521 | | 132101 | o 


= +r —— 


Calculator Scor Flux i + Scor similaritate MELODICĂ — 


ec Deere, >| Calculeaza scoruri de similaritate la 
nivelul fiecărui flux. 
Formula: Pairs 
(max. DELTA ritmic) y1- (medie_valor_delta/ $ & Scor similaritate RITMICĂ 


valoare_maxima_descriptor) 
(max. DELTA gravitonic) | fa 


© Scor similaritate GRAVITONICA 


Calculator Scor General 


Calculeaza scorul general de 
similaritate la a celor două fragmente i 


Formula: k 
simălaritate_melodică * 
simăaritate_ritmică * fA 
similartate_gravitonică 


Fig. 1b. Diagrama mixtă (schemă bloc și flux de lucru) a 
algoritmului de aproximare a similitudinii dintre două fragmente 
melodice arbitrare (continuare). 
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Postulăm deci, pentru început, că pentru stabilirea 
similaritatii dintre două fragmente melodice oarecare, este 
necesară și suficientă cuantificarea asemănărilor observate la 
nivelul a trei paliere de evoluţie muzicală: ritmic, intonational si 
gravitonic!. Mai exact, stipulăm că două fragmente melodice 
sunt cu atât mai analoage cu cât produsul scorurilor de 
similaritate ale acestor paliere este mai apropiat de valoarea 
unitară. Pentru ușurința procesării, cele trei paliere/planuri vor fi 
extrase separat in câte o listă izomorfa de evenimente 
unidimensionale. Astfel, dacă ar fi să reprezentăm într-un grafic 
— de exemplu — lista corespunzătoare planului intonational, am 
obţine o evoluție constantă și monotonă a unor puncte spatiate 
în mod egal, întrucât factorul temporal a fost în prealabil 
eliminat (probabil „uniformizat” ar fi o exprimare mai potrivită). 


Un aspect inconturnabil, de care depinde procesul 
efectiv de comparație, îl reprezintă reconcilierea numărului de 
elemente din lista sursă (corespondentă fragmentului melodic 
„de comparat”) si cea țintă (lista omoloagă, reprezentând 
fragmentul melodic „cu care se compară”). Din moment ce este 
perfect posibil ca fragmentele melodice alese pentru 
comparaţie să conţină un număr diferit de sunete, listele 
rezultante vor avea, inevitabil, un număr diferit de elemente. 
Întrucât procesul de comparare folosit operează exclusiv cu 
liste de dimensiuni identice, avem la dispoziţie două procedee 
pentru forțarea acestei situații: 


1 Folosesc acest termen pentru a exprima — independent de vreun 
context tono-modal — gradul de stabilitate pe care îl „respiră” o 
muzică: cât de acută este senzația de apartenenţă a ei la un sunet 
(sau la un sistem de sunete) pivot care catalizează și organizează 
întregul discurs sonor. O măsură obiectivă a gradului de gravitonie a 
unui parcurs monodic oarecare este greu de oferit, însă putem 
încerca să-l derivăm din ierarhia sa sonoră: cu cât un număr mai mare 
de sunete importante este utilizat în plasamente metrice mai 
favorabile (timpi sau parti de timp „tari”) sau în puncte cheie ale 
discursului — început, sfârșit, climax pozitiv și/sau negativ —, cu atât 
cresc șansele ca respectiva muzică să fie mai solid „ancorată” (pe 
respectivele sunete). 
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e medierea: comasarea valorilor a două elemente învecinate 
într-o singură valoare, care să conţină media lor aritmetică — 
și înlocuirea celor două valori cu valoarea unică, astfel 
calculată; 


e interpolarea: obţinerea unei valori intermediare pe baza a 
două valori existente, învecinate — și inserarea noii valori, 
astfel calculate, între cele două. 


Evident că ambele abordări deformează conţinutul 
original al palierului observat, și introduc în ecuaţie determinanti 
arbitrari, ceea ce deschide ușa către erori și rezultate fals 
pozitive. Într-o încercare de a distribui această influență 
potential-daunatoare între cei doi operanzi — cele două 
fragmente melodice pe care le comparăm — astfel încât per 
ansamblu (la nivelul întregului proces) șansele de obținere a 
unui rezultat verosimil să nu fie micșorate de aplicarea medierii 
sau interpolării, ambele procedee vor fi utilizate. Anume, se va 
calcula media numărului total de elemente din cele două liste, 
după care lista „mai scurtă” decât media va fi interpolată, în 


vreme ce lista „mai lungă” — mediată. 


Modul concret de aplicare a procedurilor de mediere si 
interpolare depinde de planul concret (ritmic, intonational, 
gravitonic) a cărui extracţie se execută: 


e pentru planul ritmic, se operează cu fracțiile care 
desemnează duratele muzicale ale sunetelor implicate; 
rezultatul (media sau valoarea interpolată a două durate 
adiacente) este forțat la cea mai apropiată valoare legitimă”; 


e pentru planul intonational, se operează cu înălțimile 
sunetelor (exprimate în valori MIDI). După ce se produc 
înălțimile derivate (prin mediere sau interpolare), se aplică 
un filtru care constrânge fiecare valoare obținută la cea mai 
apropiată treaptă a scării intonationale observată în 
fragmentul melodic original — într-o încercare de a împiedica 


1 Numitorul fractiei trebuie sa fie o putere a lui 2, iar fractia nu poate fi 
supraunitară. 
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muzica derivată să „iasă din mod” (procedura este una 
elementară, si nu garantează conservarea ethosului initial, 
însă cel puţin nu vom avea erori flagrante, de tipul adăugării 
unui so# într-o melodie compusă în modul dorian’); 


e planul gravitonic se poate aproxima pe baza ierarhiei 
înălțimilor. Mai exact, vom favoriza acele înălțimi din zona 
de „vârf ” a ierarhiei — vorbim de evenimente sonore care au 
plasamente  strategic-avantajoase în cadrul melodiei 
(început, final, climax pozitiv, climax negativ) şi/sau 
plasamente metrice privilegiate — și o vom face în 
detrimentul celorlalte sunete, care vor fi, astfel, împinse și 
mai mult către „baza” acestei ierarhii (sau către ultimele 
poziţii ale listei, dacă vrem să privim de manieră lineară 
acest „clasament” al undelor hertziene). Într-un ultim pas, 
vom injumatati lista, păstrând doar porţiunea superioară, 
care astfel va reprezenta — destul de fidel — „treptele” în 
jurul cărora pivotează melodia noastră. Acestea sunt, în 
ultimă instanţă, valori MIDI, și vor fi mediate sau interpolate 
după aceleași reguli observate anterior (pentru planul 
intonational). 


Pasii ulteriori ai procesului de comparare vor trata toate 
elementele derivate (inserate artificial in lista prin mediere sau 
interpolare) ca pe elemente autentice. 


La baza abordarii care urmeaza sta asertiunea ca, in 
procesul intuitiv de decelare a semanticii unui material melodic 
dat, ascultatorul utilizează inconştient o scală mobilă de repere 
auditive. Melodic vorbind, în funcţie de această scală, orice 
sunet nou-auzit este fie mai acut, fie mai grav, fie de aceeași 
înălțime cu sunetul ultim auzit. În același timp, el este fie mai 
acut, fie mai grav, fie de aceeași înălțime cu sunetul anterior 
aceluia (sunetul penultim auzit), și așa mai departe, numărul de 
repere anterioare variind în funcţie de factori precum varietatea 
melodică a pasajului, pregnanta contextuală a sunetelor 


1 Dorianul, sau doricul, este modul natural construit pe sunetul Re. 
Vezi si: Gheorghe Firca, Dicţionar de termeni muzicali, Bucuresti, 
Editura științifică și enciclopedică, 1984, p. 298—304; 
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anterioare, atenţia ascultătorului, experienţa sa anterioară cu 
tipul de muzică respectiv, etc. La fel, ritmic vorbind, orice sunet 
nou-auzit este fie mai lung, fie mai scurt, fie de aceeași durată. 
Din punct de vedere gravitonic, sunetul curent fie întărește 
modul din care fac parte sunetele anterioare (așa cum fac de 
pildă, tonica, sensibila/subtonul, coarda de recitare), fie îl 
destabilizează (așa cum fac sunetele străine de mod) fie nu are 
nicio influență asupra lui (în principiu, toate treptele secundare 
se găsesc în această situaţie). 


Pe această bază construim un mecanism generic de 
pre-procesare a informațiilor. Dată fiind o fereastră de analiză, 
reprezentând — efectiv — numărul de sunete anterioare de 
utilizat ca repere, informaţiile despre înălțime, durată, si 
caracter gravitonic vor fi extrase în fluxuri separate și stocate 
folosind una din trei valori posibile: diferit pozitiv (+), diferit 
negativ (-) și identic (=). Vom folosi o modalitate foarte 
îndemânoasă pentru a serializa” întreg conținutul unei ferestre 
de analiză într-o singură unitate de date, al cărei format se 
pretează excelent la manipulări aritmetice: sistemul binar?. 


1 În informatică, se referă la procesul contopirii mai multor fluxuri 
paralele si concomitente de date într-un șir unic, în care respectivele 
date se distribuie succesiv; vezi serializa și în: Florin Marcu, Marele 
dicționar de neologisme, București, Editura Saeculum, 2000; 

2 Sistem de reprezentare numerică în baza 2, în care orice valoare 
este reproductibilă prin suma unor puteri ale lui „doi”; de pildă, 
noțiunea numerică „trei” se reprezintă în sistem binar prin 22 + 21, 
adică, în sistem decimal, 1 + 2, deci 3. Sistemul binar folosește doar 
două cifre, prin convenţie alese să fie © si 1. De la dreapta la stânga, 
ele semnifică — prin echivalență cu sistemul decimal: unități (sau 2°), 
doi-uri (21), patru-uri (22), opt-uri (23), saisprezece-uri (2%) ș.a.m.d. 
Astfel, numărul 3 în sistem decimal se scrie 11 în sistem binar (citit 
„unu-unu”), numărul 5 în decimal se scrie 101 (,,unu-zero-unu”) în 
binar, ș.a.m.d. Cifra „unu” practic înseamnă, acolo unde o observăm, 
că trebuie să adunăm respectiva putere a lui 2. În exemplul anterior, 5 
în sistem decimal este 101 in sistem binar, adică: (1 * 22) + (© * 
21) + (1 * 2°); vezi si: The Editors of Encyclopaedia Britannica, 
„Binary number system” în Encyclopedia Britannica, 
https://www.britannica.com/science/binary-number-system. 
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Calculatoarele moderne folosesc sistemul binar pentru a stoca 
până la 64 de biti’ de informatie într-o (unică) valoare numerică. 
Întrucât „scala” noastră de evaluare are câte trei valori posibile 
per reper, putem utiliza o fereastră de analiză de maximum 21 
de repere (64/3, ignorând zecimalele). Aceasta depășește cu 
mult abilităţile de percepţie ale celui mai experimentat 
ascultător uman pe care îl putem găsi — deci abordarea ne 
oferă un spațiu de manevră cu totul generos. 


Să luăm un exemplu concret: 


Pi a 


6, — fe = tye te 2 þe] 
a ees 


<—— etc. 


1. fie dat pasajul melodic? din care a fost anterior 
eliminată orice informatie ritmică sau metrică: re — la — 


mi — mi — fat — do#?— sol#— sol4— mib? — sib; vom 


1 Cea mai mică unitate posibilă de stocare a informaţiei, capabilă să 
stocheze la un moment dat doar una din două valori reprezentabile 
(adevărat — fals şi unu — zero fiind cele mai comune reprezentări). Bit- 
ul realizează, la un nivel elementar, joncţiunea conceptuală cu 
realitatea fizică dintr-o maşină electronică de calcul: un condensator 
electric poate fi fie încărcat cu electricitate (starea adevărat sau unu), 
fie descărcat (starea fals sau zero). Biţii sunt însă inutili per se, 
capacitatea lor de stocare fiind insuficientă pentru aproape orice uz 
practic. Pentru a fi operativi, biții sunt grupaţi în unităţi de stocare, cea 
mai comună fiind cea de 8 biţi, cunoscută ca octet, sau — mai comun — 
byte (importat din engleză, ca atare); vezi și: Werner Buchholz ei. a., 
Planning a Computer System, New York, McGraw-Hill Book Company 
Inc., 1962. 
2 Ernest Chausson, Concertul pentru vioară, pian și cvartet de coarde în 
Re major, op. 21 măsurile 5-10, vioara |; 
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folosi o fereastră de analiză de doar 7 sunete, și vom 
considera sunetul terminus al pasajului (să ca sunet 
curent; 


progresând recursiv, dinspre sunetul curent înspre cel 
mai îndepărtat reper — raţiunea abordării recursive se 
va evidenția într-un pas de lucru următor — vom 
examina deci următoarele șapte raporturi de înălțime: 


i. mib? — sib: comparatia produce rezultatul „diferit negativ”, întrucât sunetul 


curent este mai grav decât reperul; în consecință, notăm semnul minus; 


ii. sol-sib: rezoluţia este „diferit pozitiv”, întrucât sunetul curent este mai acut 


decât reperul; notăm semnul plus; 
iii. sol#-— sib: diferit pozitiv; notăm plus; 


iv. do#?—sib: diferit negativ; notăm minus; 


v. fa#- sib: diferit pozitiv; plus; 
vi. mi#- sib: diferit pozitiv; plus; 


vii. mił- sib: diferit pozitiv; plus; 


3. sumarizând cele șapte rezultate, si reproducandu-le în 


notația simbolică asociată, obținem șirul de semne: 
-++-+++; 


transferăm cele de mai sus într-un model matematic, 
pe care-l vom încărca apoi în memoria de lucru a 
maşinii de calcul: reiterez, întrucât am folosit o 
fereastră de analiză alcătuită din 7 sunete reper, iar 
fiecare reper poate ,,tine” una din trei valori posibile 
(pozitiv, negativ, identic), avem nevoie de 7 grupuri a 
câte 3 unităţi. Prin convenţie, unităţile din fiecare grup 
vor reprezenta, de la stânga la dreapta: diferit pozitiv 
(+), diferit negativ (-), și identic (=). Cele 7 grupuri, 
odată completate, vor arăta deci astfel: 
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Alocare | [*] * * E * * | =] 
Semnificație | + | - | = +|-|= +|- = +|-|= +|-|=]+ -|= +|- = 


Tabel 1. Corespondenta dintre modelul simbolic de exprimare a evoluţiei relative a înălțimilor şi modelul 
matematic de stocare a lor. In acest exemplu, doar cele mai recente 7 înălțimi sunt monitorizate. 


Transpunând într-un „cuvânt de date”! de 64 de biţi cele 
de mai sus — vom porni din dreapta, și vom păstra schema de 
alocare în formularea ei existentă — obținem următorul tabel, în 
care fiecare coloană, de la dreapta la stânga?, reprezintă o 
putere a lui 2 (vezi primul rând al tabelului): 


2 ssi 15 13 6]5|4|3 110 
Alocare biti * * * 
Semnificatie = ]+|- =7+/-/= 4+ ]-/= 


Tabel 2. Transpunerea evoluţiei relative a celor mai recente 7 înălțimi în primii 21 de biţi ai unui cuvânt de 
date de 64 de biţi. Se folosește modul „Little Endian” de ordonare a octeților. 


Cititorul tehnic ar putea opina că alocarea descrisă mai 
sus nu este deloc economică (folosim doar 21 de biţi dintr-un 
cuvânt de 64 de biţi, ceea ce înseamnă că practic irosim 43 de 
biti) însă îi vom răspunde că: (1) numai de dragul simplităţii am 
ales în exemplul de fata să monitorizăm evoluţia a doar 7 
sunete reper; asa cum am descris mai sus, sistemul nostru 
suportă comparații „lungi” de până la 21 de repere muzicale, 
situație care va consuma 63 din cei 64 de biti disponibili (21 * 
3), ceea ce întrebuințează foarte eficient memoria disponibilă; și 
(2) memoria de lucru — îndeobște cunoscută astăzi sub numele 


1 Unitate standard de stocare a informaţiei; vezi si: 
https://www.computerhope.com/jargon/d/dataword.htm. 
2 Convenţia fiind bazată pe faptul că majoritatea calculatoarelor în uz 
astăzi folosesc modul Little Endian de ordonare a octetilor, in care 
octetul cel mai puţin semnificativ, adică cel ce ţine puterea ce mai 
mică a lui 2, este accesabil prin adresa din memorie cu numărul cel 
mai mic; vezi și: 
https://searchnetworking.techtarget.com/definition/big-endian-and- 
little-endian. 
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mai popular de RAM! — a devenit cel mai ieftin si mai ușor de 
procurat component al unui calculator, ceea ce justifică complet 
decizia de a nu ajusta dimensiunea cuvântului de date la 
numărul de repere utilizat (dacă am face-o, acest lucru ar 
atrage după sine, firește, o logică mai complicată de 
gestionare). 


Cuvântul complet, în notație binară, ar fi: 


0000000000000000000000000000000000000000000010100100010100100100 


iar echivalentul său în notație zecimală ar fi: 


DADA 2405402 Be 2010 + 2.014 + 2017 + 219.= 
4 + 32 + 256 + 1024 + 16384 + 131072 + 524288 = 673060 


Valoarea numerică astfel obținută, 673060, stochează în 
ea, deși într-un mod ermetic, o descriere în egală măsură 
precisă și flexibilă a evoluţiei ultimelor 7 înălțimi din melodia 
noastră — prin raportare la înălțimea curentă (sunetul sà. 
Examinarea recurentă, palindromică, a raporturilor a făcut ca 
reperele din imediata vecinătate a înălțimii curente să capete o 
pondere semnificativ mai mare -— şi, în consecinţă, să 
influențeze mai mult valoarea finală decât cele îndepărtate. În 
fapt, în modelul de calcul prezentat aici, influenţa reperelor 
asupra valorii numerice rezultante descrește exponential, pe 
măsură ce acestea se îndepărtează de sunetul curent. 
Considerăm că aceasta reflectă modelul uman de percepție 
muzicală. 


În baza mecanismului generic de pre-procesare a 
datelor — detaliat în urmă cu câteva pagini — se obțin, deci, câte 


1 Memorie cu acces aleator (Random Access Memory — eng.); vezi si: 


https://www.digitaltrends.com/computing/what-is-ram. 
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două liste cu valori numerice — ca cea de mai sus — pentru 
fiecare plan (intonational, ritmic, gravitonic) al celor două 
segmente melodice de comparat. 


Procesul efectiv de comparare a două liste omoloage — 
de pildă, compararea listelor care stochează evoluţia planului 
intonational — constă în parcurgerea ordonată și simultană a 
elementelor lor, și în executarea operației pe biti de excluziune 
reciprocă! (XOR) asupra fiecărei perechi de valori 
corespondente. Operația produce o valoare delta care reţine, 
dintre raporturile stocate în interiorul valorilor numerice ale 
ambilor operanzi, doar diferențele. Valoarea va tinde spre 0 cu 
cât diferenţele la nivelul perechii comparate sunt mai mici. 


Maximul posibil pentru o valoare delta se poate calcula 
— prin prisma procedeului descris anterior — asumând diferit 
pozitiv (+) pentru fiecare sunet reper din fereastra de analiză. 
Reiterând exemplul folosit deja, pentru o fereastră de analiză 
de 7 sunete, delta maxim ar fi: 


PIA da 9 II te ci A Za ALTE, tip A Mast I ea ie A ta Vaal A bad a E A = SS casa E 
4 + 32 + 256 + 2048 + 16384 + 131072 + 1048576 = 1198372 


Media aritmetică a tuturor valorilor delta obținute — sau 
media ponderată, dacă dorim să oferim importante diferite celor 
trei planuri —, raportată la valoarea delta maxim, va produce 
inversul rezultatului scontat: o valoare care tinde spre 0 cu cât 
cele două fragmente melodice sunt mai similare. Dorim, firește, 
inversarea acestei valori — prin scăderea ei din 1 —, ceea ce ne 
va produce rezultatul dorit, anume, o valoare care tinde spre 1 


1 Operatie logică ce compară două șiruri de biti și produce un al 
treilea, în care toate perechile originale de biţi respectiv diferite produc 
bit-ul 1, şi toate perechile respectiv identice produc bit-ul 0, de 
exemplu: 101 ^ 011 = 118; vezi si: 
https ://www.pcmag.com/encyclopedia/term/xor. 
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cu cât cele două fragmente melodice sunt mai similare (și spre 
0 cu cât ele sunt mai diferite). 


Procedura descrisă mai sus este utilă pentru evaluarea 
similarităţii directe a două fragmente melodice date. De 
asemenea, atâta timp cât profilul melodic, ritmic sau gravitonic 
general rămân nealterate în pasajul ţintă (prin prisma pasajului 
sursă), cele două melodii vor fi evaluate ca fiind similare — chiar 
dacă conţin, propriu-zis, alte înălțimi și durate muzicale. Faptul 
datorează mult modalităţii de pre-procesare a informaţiilor (vezi 
anterior), care oferă suficient spaţiu de manevră pentru 
procedeele comune de travaliu tematic, cum ar fi 
augmentarea/diminuarea ritmică şi/sau  intervalică). Însă 
muzica, si prin excelenţă cea clasică, operează frecvent cu 
similarități ascunse, materialul tematic nou fiind uneori derivat 
prin mecanisme de complexitate sporită, precum recurenta, 
ranversarea — citirea în oglindă fata de o axă de simetrie, de 
obicei mediană — sau combinaţiile lor. Aceste mecanisme, 
observate îndeobște la nivelul planului melodic (dar utilizate 
destul de consecvent și în cel ritmic) produc perechi de 
fragmente melodice pe care algoritmul descris mai sus le va 
considera foarte putin, sau deloc similare — pe când urechea 
unui ascultător antrenat le va găsi cel puţin „înrudite”. 


Pentru a soluţiona această problemă, introducem patru 
iterații (opţionale) în procesul de evaluare, iterații în care 
fragmentul melodic sursă este, respectiv, (1) citit recurent, (2) 
inversat, (3) citit recurent și apoi inversat, și în fine, (4) inversat 
și apoi citit recurent. Transformările vor fi volatile (se vor 
petrece pe o copie a materialului original, acesta rămânând 
nealterat) și se vor aplica direct la nivelul valorilor brute ale 
planului respectiv de analiză. De exemplu: 


e pentru obținerea unei versiuni recurente a planului melodic, 
înălțimile MIDI ale tuturor sunetelor din fragmentul muzical 
sursă vor fi citite „de la coadă la cap”; 


e pentru o versiune ranversată a aceluiași plan, se calculează 
inaltimea/valoarea MIDI „axă” — procedura constă pur și 
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simplu în obţinerea mediei ponderate dintre maximul și 
minimul melodic (ponderea fiind expunerea ritmică totală a 
fiecărei înălțimi) — și se procedează la citirea cu sens 
schimbat a tuturor intervalelor melodice care se formează 
între axă și fiecare sunet din fragment; 


e pentru o recurenţă ritmică, toate fracțiile implicate în 
fragmentul melodic vor fi citite de la dreapta la stânga; 
ș.a.m.d. 


De menţionat că, din raţiuni de conservare a resurselor 
de calcul, vom omite acele scenarii care fie nu sunt foarte 
frecvente în literatura muzicală, fie produc perechi de fragmente 
melodice în care similaritatea devine pur notionala. Astfel stand 
lucrurile: 


e nu vom aplica niciunul din aceste procedee la nivelul 
planului gravitonic; 


e nu vom aplica procedeele defalcat: nu vom testa, de pildă, 
similaritatea unui fragment dat, cu o variantă a sa obţinută 
prin ranversare melodică si recurenţă ritmică; prin excepție, 
vom lua în calcul intrebuintarea selectivă a unui procedeu, 
altfel spus, utilizarea sa asupra unui singur plan — care, cel 
mai adesea, va fi cel melodic; 


e vom omite cu bună știință inversarea intervalică (înlocuirea 
fiecărui interval din fragmentul melodic cu răsturnarea” sa, 
de exemplu, secunda mare cu septima mică, terta mică cu 
sexta mare, etc). 


Întrucât similaritatea directă este mai uşor de decelat de 
ascultător, și în consecință mai pregnantă, fiecare procedeu de 


1 Într-un interval sau acord, mutarea celui mai grav sunet la octava 
superioară, sau a celui mai acut sunet la octava inferioară; vezi și: 
Gheorghe Firca, Dicţionar de termeni muzicali, Bucureşti, Editura 
științifică si enciclopedică, 1984, p. 406; 
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transformare aplicat fragmentului original va atrage după sine o 
atenuare a scorului de similaritate obţinut. Astfel, o pereche în 
care recurenta fragmentului melodic sursă este identică cu 
fragmentul ţintă va obţine un scor (final) de similaritate mai mic 
decât o pereche în care fragmentul sursă, netransformat, este 
identic cu fragmentul ţintă. 


Detectia automată a similitudinilor dintre două surse 
melodice distincte poate constitui, incontestabil, un prețios 
instrument de lucru în mâna muzicologului care urmărește să 
stabilească grade de înrudire la nivelul unui fond general de 
opus-uri — și, prin aceasta, apartenenţa respectivelor muzici la 
un corp comun de trăsături stilistice. În ce ne privește însă, 
suntem mai interesaţi de valenţele acestui algoritm atunci când 
este utilizat în interiorul aceleiași surse — altfel spus, ne 
preocupă mai degrabă similaritatile selective observabile în 
cadrul restrâns al unui material muzical dat. 


În acest sens, procedurii îi poate fi dată o utilitate 
imediată ca adjuvant. Altfel spus, dacă o aplicăm asupra unei 
melodii împărțite deja în secţiuni și sub-sectiuni pe baza altor 
criterii — de pildă, pe baza unei metode euristice pe care o voi 
detalia cu altă ocazie, metodă ce aproximează gradul de 
importanță a fiecărui sunet dintr-o melodie data’; cele mai 
importante sunete, astfel descoperite, capătă apoi rolul de 
jonctiuni, sau „pietre de hotar” — procedura noastră de detecție 
a similitudinilor poate stabili în ce măsură un segment formal se 
află într-un raport de consecvență cu un altul (care îi este 
antecedent). 


Mai interesant încă, algoritmul poate fi folosit ca atare, 
ca un mecanism de sine stătător, scopul acestei abordări fiind 
acela de a creiona o schemă formală a melodiei date în baza 
filiatiei dintre diversele sale părți componente. În lipsa altor 
jaloane sau marcatori, algoritmul va fi nevoit sa opereze „în 


1 Algoritmul este descris deja în teza mea de doctorat, dar iau în 
considerare și publicarea sa separată. 
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orb”, făcând uz de o „fereastră culisantă”!, o metodă de căutare 


clasică, utilizată în programarea dinamică?. Fereastra culisanta 
este, în esență, o procedură de tip „forță bruta’’, și în 
consecinţă reclamă o cantitate semnificativă de resurse de 
calcul. Concret, în baza unui număr de evenimente melodice 
specificat iniţial, se va stabili, la începutul traiectului melodic 
dat, o porţiune fixă — fragmentul sursă — care va fi „căutată” 
apoi în restul melodiei, avansând căutarea cu câte o porţiune 
identică — producând, practic, fragmente țintă volatile — pana se 
atinge punctul terminus al succesiunii de înălțimi date. Apoi 
fragmentul sursă „avansează” după ultimul sunet al poziției sale 
anterioare, și căutarea se reia, de data aceasta cu noul 
material. Procesul se repetă până când fragmentul sursă 
ajunge la o distanță mai mică decât lungimea sa, fata de 
capătul melodiei. De notat că descrierea de mai sus este pur 
informativă, ea reprezentând doar implementarea „naivă” a 
procesului. În realitate, vor exista reguli de optimizare care vor 
redimensiona „din mers” fereastra de căutare, și/sau o vor muta 
de manieră non-secventiala, în funcţie de rezultatele găsite deja 
— imbunatatind astfel atât timpii de execuţie cât și rezultatele 
obținute. 


La finele operaţiei, fragmentele adiacente cu scoruri 
mari de similaritate sunt grupate în secţiuni mari. Fragmentele 
însele vor constitui, semantic vorbind, subsectiunile liniei 
melodice date. Evident, fidelitatea reprezentării formale crește 
odată cu micșorarea numărului de evenimente melodice care 
compun iniţial fereastra culisantă, însă totodată crește și 
numărul de operaţii necesare — și, implicit, resursele de calcul 
reclamate. 


1 Sliding window (eng); vezi și: https://medium.com/outco/how-to- 
solve-sliding-window-problems-28d67601a66. 

? Dynamic programming (eng); vezi si: 

https ://www.educative.io/courses/grokking-dynamic-programming- 
patterns-for-coding-interviews/m2G1pAq0000. 

3 Brute force (eng); vezi si: 


https://www.webopedia.com/definitions/brute-force. 
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Cele de mai sus reprezintă probabil punctul terminus al 
unei căutări a perfecțiunii logice, al unui efort către obținerea 
unei fiabilitati și obiectivitati extreme a actului de analiza 
muzicala ce a demarat, informal, in a doua jumatate a secolului 
trecut. Nu ma refer, fireste, la algoritmul de mai sus — care inca 
trebuie validat prin implementare, si prin multe, nesfarsite 
sesiuni de teste — ci la faptul însuși că tehnica de calcul de 
ultima generaţie a ajuns sa fie pusă în slujba unor obiective 
precum stabilirea alcătuirii formale a unui fragment muzical dat. 
Pentru că preocupările mele nu sunt nicicum izolate, iar 
demersul de fata nu este un pionierat (cel putin nu în plan 
internaţional). Ce-i drept, algoritmul și abordarea de mai sus 
sunt originale, ele îmi aparţin în totalitate. Însă analiza muzicală 
(inclusiv calculul similaritatii melodice) se bucură în ultima 
vreme de un interes ingineresc crescând, și mă limitez la a 
menţiona studiile conduse de Greg Aloupisy și Stefan 
Langermanx!. 


Bineînţeles, fenomenul nu se limitează la zona criticii, el 
fiind deja foarte prezent în creația muzicală. Este încă neclar în 
ce măsură sunt benefice, pe termen foarte lung, și într-un 
context general-uman, aceste tendințe către tehnologizare, 
algoritmizare si rationalizare extrema — către mașinizare, in 
ultima instanta — a unor intreprinderi umane considerate a fi, 
pana nu demult, reflexii ale spiritului, si manifestări ale 
inefabilului. Însă bănuiesc că nici nu vom afla, cel putin nu în 
timp util. În întreaga sa istorie, evoluţia tehnologică a speciei 
homo sapiens a precedat-o cu mult pe cea psihologică sau 
comportamentală. 
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SUMMARY 


Claudius lacob 

Computer - aided musicology 

An original algorithm for approximating 

the degree of similarity of two arbitrary melodic profiles 


The degree of similarity of two given melodic fragments can be 
approximated using an O(n) complexity algorithm, which 
retrogradely compares the ratios between a current sound and 
all those before it (not exceeding an imposed calculation limit, 
the "analysis window"). The two melodic fragments to compare 
are previously divided into three primary flows: intonational, 
rhythmic and gravitonic (a linear approximation of the 
intonational hierarchy that governs the fragment). In order to 
force the three pairs of homologous streams to have, 
respectively, the same number of elements, mediations 
(replacement of two adjacent elements with their average) or 
interpolations can be performed. For each sound analysed, its 
relation to the previous sounds shall be noted using a grid of 
three possible values ("identical", "more" or "less"). The strings 
thus obtained are serialized in binary, and processed by simple 
arithmetical operations. 
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